#actividad de voz

MuVAP: Modelo multimodal para predicción de turnos en conversaciones

Descubre MuVAP, el modelo que predice quién hablará usando solo audio y una cámara. Ideal para robots sociales. Más preciso que los modelos actuales.